Asymmetric Actor-Critic
Asymmetric
Actor-Critic
ActorとCriticで使用する情報を変える
価値関数
により多くの情報を与える
正確な状態価値を推定するため
実行時は方策のみ使う
例
Learning Dexterous In-Hand Manipulation